6 research outputs found

    Configurable EBEN: Extreme Bandwidth Extension Network to enhance body-conducted speech capture

    Full text link
    This paper presents a configurable version of Extreme Bandwidth Extension Network (EBEN), a Generative Adversarial Network (GAN) designed to improve audio captured with body-conduction microphones. We show that although these microphones significantly reduce environmental noise, this insensitivity to ambient noise happens at the expense of the bandwidth of the speech signal acquired by the wearer of the devices. The obtained captured signals therefore require the use of signal enhancement techniques to recover the full-bandwidth speech. EBEN leverages a configurable multiband decomposition of the raw captured signal. This decomposition allows the data time domain dimensions to be reduced and the full band signal to be better controlled. The multiband representation of the captured signal is processed through a U-Net-like model, which combines feature and adversarial losses to generate an enhanced speech signal. We also benefit from this original representation in the proposed configurable discriminators architecture. The configurable EBEN approach can achieve state-of-the-art enhancement results on synthetic data with a lightweight generator that allows real-time processing.Comment: Accepted in IEEE/ACM Transactions on Audio, Speech and Language Processing on 14/08/202

    A Dynamic System Simulation Device to Define Human-System Interface Requirements for the Dassault Rafale

    Get PDF
    Our study aimedto collect enhancement proposals of Rafale fighter aircraft human-system interface. Proposals had to be innovative and complied with the needs of information for pilots regarding Rafale future capabilities. We developed amethodology based on a device enabling the simulation of a dynamic system activity that is theRafale integrated in its war environment. Creativity of front line pilots participating inthis experimentation has been stimulated but constraint by the necessity ofa useful production due to the risks associated to the modification of a fighter aircraft already operating since 2006. Each proposal has been analyzed and synthetized through the abstraction hierarchy model of Rasmussen (1986). Results showed that for prospective and retrospectivefields,a specific tactical support built with models favored the expression of functional objective and that a board as a basic human-system interface favored the expression of physical functions. In the discussion, we supported the relevance of our methodology for the definition of human-system interface requirements in various dynamic systems

    Deep Learning pour l’amélioration de signaux vocaux captés avec des transducteurs intra-auriculaires

    No full text
    National audienceCe projet de recherche est né d’une collaboration entre l’équipe LMSSC (Laboratoire de Mécanique des Structures et des Systèmes Couplés) du CNAM et l’équipe APC (Acoustique et Protection du Combattant) de l’ISL. Il a pour objectif d’améliorer l’intelligibilité de la parole captée par un microphone intra-auriculaire développé par l’ISL. Ce dispositif de captation non- conventionnel, adossé à une protection auditive active, permet de capter les signaux vocaux émis par un locuteur en éliminant toutes nuisances sonores extérieures. Cependant, le trajet acoustique entre la bouche et les transducteurs est responsable d’une perte totale d’information au-delà de 2 kHz. En basses fréquences, une légère amplification ainsi que des bruits physiologiques sont observés. Nous avons donc à faire à un problème de reconstruction de signal absent en hautes fréquences et de débruitage.Les méthodes par apprentissage profond seront privilégiées pour la reconstruction des hautes fréquences au détriment du modèle source-filtre qui n’est pas capable de rétablir d’information manquante.Une première phase d’analyse des signaux captés est nécessaire pour modéliser la dégradation et observer sa variabilité. La conception d’une base de données conséquente est alors rendue possible avec un filtrage numérique simulant les détériorations observées. Afin d’augmenter la richesse de cette base de données et d’éviter tout phénomène de sur- apprentissage, une composante aléatoire sera introduite dans le filtrage.La conception de réseaux de neurones profonds est maintenant rendue possible pour la régénération du signal émis à partir du signal dégradé. Une vaste exploration sur l’architecture des réseaux, les fonctions de coût utilisées et les stratégies d’apprentissage sera entreprise. L’objectif final est d’intégrer un réseau d’inférence sur une carte de programmation pour un traitement en temps réel. Une attention particulière sera attachée à la taille du réseau et au délai de traitement sur ce type d’architecture légère et peu consommatrice d’énergie

    Deep Learning pour l’amélioration de signaux vocaux captés avec des transducteurs intra-auriculaires

    No full text
    National audienceCe projet de recherche est né d’une collaboration entre l’équipe LMSSC (Laboratoire de Mécanique des Structures et des Systèmes Couplés) du CNAM et l’équipe APC (Acoustique et Protection du Combattant) de l’ISL. Il a pour objectif d’améliorer l’intelligibilité de la parole captée par un microphone intra-auriculaire développé par l’ISL. Ce dispositif de captation non- conventionnel, adossé à une protection auditive active, permet de capter les signaux vocaux émis par un locuteur en éliminant toutes nuisances sonores extérieures. Cependant, le trajet acoustique entre la bouche et les transducteurs est responsable d’une perte totale d’information au-delà de 2 kHz. En basses fréquences, une légère amplification ainsi que des bruits physiologiques sont observés. Nous avons donc à faire à un problème de reconstruction de signal absent en hautes fréquences et de débruitage.Les méthodes par apprentissage profond seront privilégiées pour la reconstruction des hautes fréquences au détriment du modèle source-filtre qui n’est pas capable de rétablir d’information manquante.Une première phase d’analyse des signaux captés est nécessaire pour modéliser la dégradation et observer sa variabilité. La conception d’une base de données conséquente est alors rendue possible avec un filtrage numérique simulant les détériorations observées. Afin d’augmenter la richesse de cette base de données et d’éviter tout phénomène de sur- apprentissage, une composante aléatoire sera introduite dans le filtrage.La conception de réseaux de neurones profonds est maintenant rendue possible pour la régénération du signal émis à partir du signal dégradé. Une vaste exploration sur l’architecture des réseaux, les fonctions de coût utilisées et les stratégies d’apprentissage sera entreprise. L’objectif final est d’intégrer un réseau d’inférence sur une carte de programmation pour un traitement en temps réel. Une attention particulière sera attachée à la taille du réseau et au délai de traitement sur ce type d’architecture légère et peu consommatrice d’énergie

    People post-stroke perceive movement fluency in virtual reality.

    No full text
    International audienceWe investigated the visual perception of biological movement by people post-stroke, using minimal kinematic displays. A group of twenty patients and a group of twelve age-matched healthy controls were asked to judge movement fluency. The movements to judge were either displayed as an end-point dot or as a stick-figure of the arm and trunk. It was found that the perception of movement fluency was preserved post-stroke, however, with an increase in the variability of judgment. Moreover, the end-point dot representation ameliorated what was perceived and judged, presumably by directing attention to the important kinematic cues: smoothness and directness of the trajectory. We conclude that, despite perception of actions is influenced by the ability of the observer to execute the observed movement, hemiparesis has a mild effect on the perception of biological movement. Yet, a valuable virtual learning environment for upper-limb rehabilitation should be implemented to provide the observer with neither too much, nor too little information to maximize learning

    Energetic and Structural Characterizations of the PET–Water Interface as a Key Step in Understanding Its Depolymerization

    No full text
    International audienceWe report molecular simulations of the interaction between poly(ethylene terephthalate) (PET) surfaces and water molecules with a short-term goal to better evaluate the different energy contributions governing the enzymatic degradation of amorphous PET. After checking that the glass transition temperature, density, entanglement mass, and mechanical properties of an amorphous PET are well reproduced by our molecular model, we extend the study to the extraction of a monomer from the bulk surface in different environments, i.e., water, vacuum, dodecane, and ethylene glycol. We complete this energetic characterization by the calculation of the work of adhesion of PET surfaces with water and dodecane molecules and by the determination of the contact angle of water droplets. These calculations are compared with experiments and should help us to better understand the enzymatic degradation of PET from both the thermodynamic and molecular viewpoints
    corecore